Quantum Circuit Learning with Error Backpropagation Algorithm and Experimental Implementation

誤差逆伝播アルゴリズムによる量子回路学習と実験実装

和訳

Abstruct

量子コンピューティングは古典コンピューターを凌駕する可能性を秘めており、様々な分野で積極的な役割を果たすと期待されています。量子機械学習においては、量子コンピューターが特徴表現の強化や高次元の状態・関数近似に有効であることが見出されています。この目的のために、近年、ノイズの多い中間規模量子コンピューター（NISQ）環境下で、量子-古典ハイブリッドアルゴリズムが提案されてきました。このスキームでは、古典コンピューターが量子回路のパラメータ調整、パラメータ最適化、およびパラメータ更新の役割を担います。本論文では、パラメータ最適化における勾配を効率的に計算し、量子回路学習のパラメータを更新できる勾配降下法に基づく誤差逆伝播アルゴリズムを提案します。このアルゴリズムは、計算速度の点で現在のパラメータ探索アルゴリズムを上回り、同等またはそれ以上のテスト精度を示します。一方、提案された理論的スキームは、IBM Qの20量子ビット量子コンピューター「ibmq_johannesburg」上で実装され、成功裏に実験が行われました。実験結果は、ゲートエラー、特にCNOTゲートエラーが、導出された勾配の精度に強く影響することを示しています。IBM Qで実行された回帰精度は、蓄積されたゲートノイズエラーにより、測定ショット回数の増加とともに低下することが明らかになりました。

/icons/hr.icon

1. Introduction

ノイズの多い中間規模量子コンピューター（NISQ）は、相当な量子エラーを伴う量子コンピューターです (1)。NISQ環境下では、エラー耐性を提供するノイズ耐性量子計算方法を開発することが不可欠です。この問題には2つの解決策があります。1つは、エラーが存在する中で量子エラーを修正しながら量子計算を実行することです。もう1つのアプローチは、量子エラーが致命的になる前に計算の量子部分を完了し、残りのタスクを古典コンピューターに移行するハイブリッド量子-古典アルゴリズムを開発することです。後者のアプローチは、量子近似最適化アルゴリズム（QAOA）(2)、変分量子固有値ソルバー（VQE）(3)、その他多くのアルゴリズム (4-6)の開発を促進しました。量子-古典アルゴリズムは、「量子超越性」(7) ではなく「量子優位性」を追求することを目指しています。量子超越性とは、量子コンピューターが、速度または解の発見において、いかなる古典コンピューターによっても達成できないレベルを達成できることを証明しなければならないと述べています。量子超越性は数十年後に出現すると考えられており、これまでに報告された「量子超越性」の事例は、誇張されているか、公正な比較に欠けているかのいずれかであるとされています [8, 9)。この観点から見ると、量子優位性はより現実的な目標であり、NISQデバイスの具体的で有益な応用を見つけることを目的としています。量子優位性の範囲内で、量子コンピューターの応用は、計算速度競争をはるかに超えて、量子化学における波動関数の表現 [10-14) や、機械学習分野における高次元特徴を強化する量子カーネルとしての利用 [15-18) など、様々な分野での利用に拡大することができます。

QAOA、VQE、またはその他のハイブリッドNISQアルゴリズムでは、モデルパラメータの最適化というタスクは困難です。これらすべてのアルゴリズムにおいて、パラメータ探索と更新は古典コンピューターで行われます。完全な古典的アプローチでは、最適なパラメータ探索は通常、数学的最適化問題として分類され、勾配ベースと非勾配ベースの両方を含む様々な方法が広く利用されてきました。量子回路学習の場合、これまでほとんどのパラメータ探索アルゴリズムは、Nelder-Mead法 [19) や量子に着想を得たメタヒューリスティクス [20, 21) などの非勾配法に基づいていました。しかし、最近ではSPSA [22) や有限差分法などの勾配ベースのものが報告されています [23)。

本稿では、パラメータ最適化に必要な勾配を効率的に計算するために、量子回路学習における誤差逆伝播アルゴリズムを提案します。本研究の目的は、これまでに報告されているものよりも優れた学習速度を持つ勾配ベースの回路学習アルゴリズムを開発することです。誤差逆伝播法は、勾配降下法を用いてパラメータを更新するために、深層ニューラルネットワーク機械学習の分野で勾配を計算する効率的な方法として知られています (24)。さらなる速度向上は、GPGPU技術を使用することで容易に実現でき、これも深層学習の分野で確立され、大きく発展しています(25)。

我々の提案の根底にある考え方は次のとおりです。図1に示すように、入力量子状態が $ |\psi_{in}\rangleであり、特定の量子ゲート$ U(\theta)が適用される場合、出力状態 $ |\psi_{out}\rangleは、量子ゲートと入力状態の内積として表現できます。

$ |\psi_{in}\rangle = U(\theta)|\psi_{in}\rangle

ここで、θ はゲート$ U(\theta)のパラメータを表します。一方、活性化関数を持たない全結合ニューラルネットワークの計算プロセスは Y=W⋅X と書くことができます。ここで、X は入力ベクトル、W はネットワークの重み行列、Y は出力です。量子ゲート$ U(\theta)は、ネットワークの重み行列 W に非常に類似しています。このことから、深層ニューラルネットワークに用いられるバックプロパゲーションアルゴリズムは、量子回路学習のシミュレーションプロセスに適用できるように、ある程度修正できることが示されます。

私たちが提案する方法は、量子ビット数が増加したり、回路の深さ（ゲート数）が増加したりした場合に、勾配計算にかかる時間を大幅に削減することを可能にします。一方、GPGPUの利点を活用することで、NISQハイブリッドアルゴリズムにおいて勾配ベースのバックプロパゲーションを使用することは、多数の量子ビットとより深い回路が展開される際に、パラメータ探索をさらに促進すると期待されます。

/icons/hr.icon

2. Quantum Backpropagation Algorithm

図1に示すように、量子回路は、以下の2点を除いて、従来のニューラルネットワークと顕著な類似性を持つ全結合量子ネットワークによって効果的に表現できます。(1) 各ノードに活性化関数が適用されないため、ノードはニューロンとは見なされません（または恒等活性化関数を仮定しています）。(2) 各層の次元が同じであるため、入力層、中間層、出力層のノード数は等しくなります。これは、中間層の次元を自由に調整できる従来のニューラルネットワークとは大きく異なります。量子回路に入力として示される状態は、$ 2^n（nは量子ビット数）のうち振幅が「1」（正規化されていない）である1つのみであることに注意してください（詳細は図1参照）。このネットワークの類似性は、深層機械学習の分野で広く使用されているバックプロパゲーションなどの学習アルゴリズムが量子回路でも共有できることを意味します。

一般的に、Backpropagation法は、偏微分の連鎖律を用いて、ネットワーク出力から勾配を逆伝播させ、重みの勾配を計算します。連鎖律のおかげで、バックプロパゲーションはノードの計算コストで入力/出力関係のみで行うことができます[24)。誤差逆伝播による量子計算のシミュレーションでは、量子状態$ |\psi\rangleと量子ゲートは複素数値で表されます。ここでは、複素数値ベクトル空間における量子バックプロパゲーションに関する導出の詳細を示します。n個の量子ビットの入力が$ |\psi_{in}\rangleであり、量子回路パラメータネットワーク$ W(\theta)が適用される場合、出力$ |\psi_{out}\rangleは次のように表現できます。

$ W(\theta)|\psi_{in}\rangle = \Sigma^{2^n-1}_{j=0} c^\theta_{j}|j\rangle = |\psi_{out}\rangle

ここで、$ c_j^{\theta}は状態$ |j\rangleの確率振幅であり、$ |c_j^{\theta}|^2 = p_j^{\theta}は状態$ |j\rangleの観測確率です。損失関数$ Lが量子測定によって決定される観測確率を用いて表現できる場合、学習パラメータの勾配は次のように記述できます。

$ \frac{\partial L}{\partial\theta} = \frac{\partial L}{\partial p^{\theta}_j} \cdot \frac{\partial p^{\theta}_j}{\partial \theta}

なぜなら、

$ p^\theta_{j} = |c^\theta_j|^2 = c^\theta_jc^{\theta*}_j

ここで、$ c_j^{\theta*}は$ c_j^{\theta}の共役です。したがって、観測確率の勾配はさらに次のように展開できます。

$ \frac{\partial p^\theta_j}{\partial\theta} = \frac{\partial (c^\theta_jc^{\theta *}_j)}{\partial\theta} = c^{\theta*}_j \frac{\partial c^\theta_j}{\partial\theta} + c^{\theta}_j \frac{\partial c^{\theta *}_j}{\partial\theta}

式(5)はさらに次のように展開できます。

$ c^{\theta*}_j \frac{\partial c^\theta_j}{\partial\theta} + c^{\theta}_j \frac{\partial c^\theta_j}{\partial\theta} = c^{\theta*}_j \frac{\partial c^\theta_j}{\partial\theta} + (c^{\theta *}_j \frac{\partial c^\theta_j}{\partial\theta})^*

式(6)は複素数を含みますが、以下に示すように実数としてうまく合計できます。

https://scrapbox.io/files/688a0fc89ea06827a2f24abb.png

公式$ \frac{\partial p_j^{\theta}}{\partial c_j^{\theta}} = c_j^{\theta*}を用いて、$ c_j^{\theta*}は次のように置き換えることができます。

https://scrapbox.io/files/688a0febf138b46edaebe3d2.png

従って、

https://scrapbox.io/files/688a100ab02a7caf592b9ac3.png

$ \frac{\partial L}{\partial p_j^{\theta}} \frac{\partial p_j^{\theta}}{\partial c_j^{\theta}} \frac{\partial c_j^{\theta}}{\partial \theta}は、深層ニューラルネットワークで用いられる従来の計算と同様に、誤差逆伝播によって得ることができます[26)。一方、提案手法の利点の1つは、複素数値を含む量子ゲート行列が実数値に変換されることです。$ \thetaに関する損失関数の勾配は、従来のバックプロパゲーションによって計算された複素ベクトル空間の実部の値から得られます。計算グラフを用いた各ノードにおけるバックプロパゲーションに関するより詳細な導出は、補足資料（S.A、S.B、S.C）を参照してください。

/icons/hr.icon

4. IMB Qを用いた実験的実装

これまで、量子シミュレータを用いたシミュレーション結果について説明してきました。NISQデバイスのような実機を使用した場合の実装アーキテクチャを図9に示します。誤差逆伝播法を使用するには、期待値$ \langle Z\rangleだけでなく、量子状態$ |\psi\rangleも準備する必要があります。したがって、図に示すように、古典コンピューター上に実量子回路と同じ構成を持つ量子回路を量子シミュレータとして準備する必要があります。これは、量子計算科学者にとって追加の負担とは見なされないことに注意すべきです。古典コンピューターとは異なり、量子コンピューターは動作中に乱されることが許されないため、量子ビットとゲートエラーを監視・診断し、古典コンピューターに対する量子コンピューターの利点を特徴付けるために、量子回路シミュレータが必要です [29-34)。したがって、実際の量子コンピューターは常に、いつでも使用できる量子シミュレータを必要とします。これは、図9の右側に示すように、対応する実際の量子コンピューターの性能に関する詳細情報をいつでも確認・取得するために量子シミュレータに常にアクセスできることを意味します。各状態$ |\psi_j\rangleの観測確率は、実量子コンピューター側で R 回ショットを実行することで計算できます。実量子マシンから得られた観測確率は、その後古典コンピューターに渡され、シミュレーション用の量子シミュレータ内の量子回路が使用されます。すべての途中情報がシミュレータ側で利用できるため、パラメータ$ \thetaはバックプロパゲーションを用いて更新できます。シミュレーション側でパラメータ$ θ^*が更新された後、次のイテレーションのために実量子マシンに返されます。

/icons/hr.icon

Conclusion

私たちは量子回路学習のためのバックプロパゲーションアルゴリズムを提案しました。提案されたアルゴリズムは、線形および非線形回帰と分類問題の両方で成功を収めました。同時に、有限差分法やSPSA法といった他の勾配ベースの手法と比較して、誤差逆伝播ベースの勾配回路学習を用いることで、計算効率が劇的に向上しました。量子シミュレータを使用することによる計算時間の短縮は、従来の方法と比較して最大で数桁という驚くべきものでした。

また、提案された理論的スキームは、IBM Qの20量子ビット量子コンピューター「ibmq_johannesburg」上で実装され、成功裏に検証されました。その結果、ゲートエラー、特にCNOTゲートエラーが、導出された勾配精度に強く影響することが明らかになりました。量子操作中に状態の振幅のほとんどが消滅するため、すべての状態を記録するために$ 2^n量子ビットメモリを必要としないことを考えると、BackpropagationとGPGPU技術を組み合わせることで、さらなる計算上の利点が期待されます。

したがって、私たちは誤差逆伝播を用いた勾配降下法が、NISQ時代だけでなく、より成熟した量子コンピューターにおいても、より深い回路深度と数千の量子ビットを持つ量子コンピューターにとって、効率的な量子回路学習ツールであると主張します。

/icons/hr.icon